GuardNet: Redes superficiales contra inyección de prompts y jailbreak
GuardNet combina redes neuronales superficiales para detectar ataques a LLMs. Logra AUROC 0.747 en benchmark ciego con solo 50ms de latencia. Ideal para producción.
GuardNet combina redes neuronales superficiales para detectar ataques a LLMs. Logra AUROC 0.747 en benchmark ciego con solo 50ms de latencia. Ideal para producción.
MAPL comprime activaciones en paralelismo de tubería con proyecciones ortogonales aprendidas, reduce comunicación sin pérdida de rendimiento en modelos LLaMA.
Descubre cómo Hyper-ICL mejora la precisión y estabilidad en aprendizaje multimodal sin necesidad de ejemplos.
AlignAtt4LLM logra traducción simultánea inglés-alemán/italiano con baja latencia aplicando AlignAtt en LLMs solo decodificador. Resultados superiores.
Descubre cómo Avatar Forcing permite generar avatares interactivos en tiempo real que reaccionan a tu voz y gestos, con baja latencia y sin etiquetado. ¡Más del 80% de preferencia!
Descubre ASKD-Whisper, una técnica de destilación adaptativa que acelera 5x el reconocimiento de voz y supera al profesor en precisión.
RTSP sigue vivo: descubre por qué este protocolo de 1998 es clave en videovigilancia y robótica con baja latencia y simplicidad.
Murmur: sistema de inferencia para ASR de larga duración que reduce la latencia 4.2x sin degradar la precisión. Atención dispersa y evicción de caché KV.